# 导入 PySpark 模块
from pyspark.sql import SparkSession

# 创建 SparkSession（Spark 应用程序的入口）
spark = SparkSession.builder \
    .appName("PySpark Example") \
    .getOrCreate()

# 示例数据
data = [("Alice", 34), ("Bob", 45), ("Cathy", 29)]
columns = ["Name", "Age"]

# 创建 DataFrame
df = spark.createDataFrame(data, columns)

# 显示 DataFrame 内容
print("原始数据：")
df.show()

# 进行转换操作：筛选年龄大于 30 的记录
filtered_df = df.filter(df["Age"] > 30)

# 显示筛选后的结果
print("筛选后的数据：")
filtered_df.show()

# 关闭 SparkSession
spark.stop()